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摘 要 采 


j 音 高 识别 与 区 分 任务 ， 以 汉语 母语 者 、 越 南 语 母语 者 和 俄语 母语 者 为 


研究 对 象 ,考察 了 两 个 语言 加 工 层面 的 因素 ,， 即 声调 范畴 感知 模式 以 及 不 同 语言 
声调 系统 的 复杂 度 差异 对 跨 领 域 音 乐音 高 感知 的 影响 。 结 果 发 现 : (1) 汉 语 和 越南 


语 两 组 声调 语言 母语 者 听 辩 结果 符合 范畴 感知 模式 ， 而 俄语 母语 者 是 连续 感知 。 


在 语言 和 音乐 两 


刺激 条 件 下 ,声调 语言 母语 者 在 范畴 边界 宽度 、 范 畴 内 区 分 率 、 


范畴 间 区 分 率 以 及 区 分 峰 度 等 指标 上 不 存在 显著 差异 。(2) 汉 语 和 越南 语 两 组 声 ; 


ZH 


语言 母语 者 的 音乐 音 高 区 分 任务 结果 差异 不 显著 。 实 验 结 果 表 明 :; 在 行为 层面 ， 母 
语 声调 范畴 感知 模式 可 以 迁移 到 音乐 音 高 感知 中 , 但 复杂 声调 系统 并 不 能 促进 跨 


领域 的 音乐 音 高 精细 感知 ,实验 结果 从 语言 对 音乐 音 高 加 工 影响 的 角度 支持 了 “ 共 
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义 (Yip, 2002)， 如 汉语 普通 话 
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不 同 的 音符 , 而 音 高 序列 构成 旋律 (Krishnan et al., 2009). 
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言 和 音乐 共有 的 基本 声学 属性 。 在 语言 中 , 音 高 表现 为 韵律 信息 , 包括 强度 、 
语调 以 及 声调 等 。 声 调 是 一 种 独特 的 语言 现象 , 声调 语言 通过 不 同 的 音 高 表达 不 同 的 词汇 
， 有 阴平 、 阳 平 、 上 声 和 去 声 四 个 声调 。 在 音乐 中 ,， 音 高 被 记 


语 


1.1 语言 音 高 和 音乐 音 高 加 工 的 “模块 论 " 与 “共享 论 ” 


音 高 在 语言 和 音乐 中 的 表现 既 有 共性 又 有 差异 ,对 这 两 个 领域 的 音 高 加 工 也 存在 不 同 
的 看 法 。 一 些 研究 支持 “模块 论 "。 如 Peretz 和 Coltheart (2003) 基 于 大 量 脑 损伤 研究 发 现 , 一 
个 领域 存在 缺陷 的 病人 另 一 个 领域 的 功能 是 完好 的 。 他 们 认为 , 音乐 能 力 与 语言 能 力 一 样 ， 
有 自己 的 程序 和 知识 库 ， 由 此 提出 了 音乐 加 工 的 “模块 化 模型 *。 在 这 个 模型 中 ,领域 一 般 性 
的 基础 声学 信息 经 分 析 后 ， 由 专门 的 子 系统 负责 处 理 音乐 音 高 。Chen 等 (2016) 以 及 Chen 等 
(2018) 对 声调 语言 母语 者 感知 音乐 音 高 的 研究 发 现 ， 这 一 群体 对 声调 和 音乐 音 高 的 辨别 结 
果 不 存在 相关 性 , 他 们 由 此 提出 “分 裂 假说 (Split Hypothesis)”， 认 为 声调 语言 母语 者 声调 与 
非 声调 音 高 特征 分 别 表征 , 加 工时 激活 不 同 的 神经 网 络 。 

相反 , 更 多 的 研究 支持 “共享 论 ”。 在 语言 能 力 与 音乐 能 力 相互 联系 的 基础 上 , Patel(2008) 
提出 二 者 可 能 共享 加 工资 源 。 基 于 声调 和 音乐 音 高 的 物理 共性 , Bradley(2013) 认 为 声调 的 音 
高 特征 (方向 、 斜 率 、 高 度 ) 与 音乐 的 音 高 特征 ( 轮 慷 、 音 程 、 音 调 ) 在 声学 层面 存在 映射 关系 。 
大 量 以 音乐 家 为 被 试 的 研究 认为 ， 音 乐 经 验 和 音乐 训练 有 助 于 提高 声调 的 感知 能 力 (Schon 
et al., 2004; Marques et al., 2007; Lee & Hung, 2008; Marie et al., 2011) 。 据 此 , Besson 等 (2011) 
提出 训练 迁移 效应 ， 认 为 语言 和 音乐 共享 神经 加 工 机 制 ,长 期 的 音乐 经 验 不 但 会 影响 两 个 领 
域 共同 的 声学 信息 加 工 ， 也 会 影响 语言 的 领域 特异 性 知觉 。Patel (2012) 进 一 步 认 为 ， 音 乐 训 
练 会 引发 大 脑 可 塑性 变化 ， 从 而 影响 语音 加 工 。 以 上 研究 立足 于 从 音乐 视角 看 语言 加 工 。 
Bidelman 等 (2013) 提 出 ,从 理论 上 看 , 语言 /音乐 加 工 引发 的 大 脑 可 塑性 变化 是 双向 的 ， 声调 
语言 母语 者 感知 音乐 音 高 也 具有 优势 。 一 些 实证 研究 支持 了 这 一 观点 ,发 现 无 论 行为 层面 还 
是 大 脑 皮层 层面 ， 声调 语言 母语 者 对 音乐 音 高 的 感知 优 于 非 声调 语言 母语 者 , 表明 一 个 领域 
的 优势 会 迁移 至 另 一 领域 (Pfordresher & Brown, 2009; Giuliano et al., 2011; Bidelman et al., 
2013; Weidema et al., 2016)。 上 述 跨 领域 研究 谈 及 声调 和 音乐 音 高 时 , 更 多 关注 了 音 高 的 领 
域 一般 性 特征 ， 即 声学 层面 上 的 基 频 变化 , 但 这 些 研 究 并 未 考虑 到 声调 作为 语言 要 素 , ER 
知 上 的 特异 性 问题 。 
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1.2 声调 范畴 感知 对 音乐 音 高 感知 的 影响 


音 位 是 语言 中 能 够 区 别 意义 的 最 小 声音 单位 ,是 根据 语音 的 社会 属性 划分 的 单位 。 音 位 
可 分 为 音 段 音 位 和 超 音 段 音 位 ， 前 者 是 从 音质 角度 划分 出 的 不 同音 位 ， 如 语言 中 不 同 的 元 音 、 


辅音 , 后 者 是 从 音质 以 外 的 音 高 、 音 长 等 角度 划分 出 的 音 位 ， 如 声调 。Liberman 等 (1957) 发 
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现 ， 英 语 母语 者 对 于 辅音 音 位 的 感知 属于 范畴 感知 (categorical perception, CP). 范畴 感知 指 听 
音 人 受 母 语音 位 影响 , 将 音 位 连续 统 中 多 个 不 同 的 声音 辨认 成 有 限 的 类 别 (Liberman et al., 
1957)。 受 该 研究 启发 ， 后 续 对 超 音 段 音 位 一 一 声调 的 研究 发 现 ， 声 调 语言 母语 者 对 不 同 声调 


音 位 连续 统 的 感知 是 范畴 感知 ， 而 非 声调 语言 母语 者 则 是 连续 感知 (Wang, 1976; Hallé et al., 


2004; Xu et al., 2006; Peng et al., 2010; Shen & Froud, 2016)。 连 续 感知 完全 依靠 声调 的 物理 属 
性 感知 声调 ,， 听 音 人 不 能 将 这 些 等 声学 间距 的 音 听 辨 为 离散 、 有 限 的 音 位 CXu et al., 2006). 

由 此 可 见 ， 感 知 声调 时 ， 苑 畴 感知 模式 要 求 听 音 人 忽视 绝 大 部 分 刺激 间 的 音 高 差异 ,将 
不 同音 高 的 刺激 感知 为 数量 有 限 的 音 位 ; 但 感知 音乐 音 高 时 , 听 音 人 需要 区 分 音 高 的 声学 差 
fF， 准确 地 感知 每 个 音符 的 音 高 。 所 以 , 声调 感知 与 音乐 感知 存在 差异 。 结 合 “共享 论 ”， 这 


提示 了 一 个 矛盾 : 如 果 语 言 和 音乐 共享 加 工 机 制 ， 声 调 语言 母语 者 的 范畴 感知 模式 可 能 会 迁 


0 
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> 移 到 音乐 音 高 感知 中 , 将 声学 上 不 同 的 音 高 感知 为 有 限 的 范畴 ， 从 而 抑制 对 音乐 音 高 的 精细 
O) 


感知 。 
以 往 研究 从 三 个 角度 对 这 一 问题 进行 过 探索 , 但 都 存在 不 足 。 第 一 ， 范 畴 感知 模式 的 跨 


领域 影响 。 这 类 研究 发 现 声 调 语言 母语 者 对 非 语言 刺激 也 体现 出 类 范畴 感知 模式 ， 暗 示 声 调 


范畴 感知 模式 的 确 存在 跨 领域 迁移 (Hallé et al., 2004; Xu et al., 2006; Peng et al., 2010)， 也 就 
是 说 , 听 音 人 可 能 会 将 语言 中 “不 同音 高 的 刺激 感知 为 数量 有 限 的 音 位 ”这 一 模式 跨 领 域 迁 
移 到 其 他 领域 中 ,抑制 音 高 精细 感知 。 但 这 些 研究 并 未 明确 提出 范畴 感知 模式 对 音乐 音 高 感 


知 的 影响 。 第 二 ,母语 声调 的 跨 领 域 抑制 作用 。 少 数 研 究 注意 到 母语 声调 可 能 存在 跨 领域 抑 


制作 用 (Bent et al., 2006; Peretz et al., 2011; Tong et al., 2018)。 如 Peretz 等 (2011) 发 现 , 汉语 普 
通话 母语 者 对 小 幅度 下 降 音符 的 感知 比 非 声调 语言 母语 者 差 , 作者 认为 可 能 是 由 于 普通 话 
降 调 通 常 涉 及 大 范围 的 基 频 变化 ,长 期 的 普通 话 声调 经 验 降低 了 被 试 对 降 调 的 敏感 度 。 但 是 ， 
这 些 研究 并 没有 明确 这 种 抑制 作用 与 范畴 感知 的 关系 。 第 三 ， 直接 考察 声调 范畴 感知 模式 对 
音乐 音 高 感知 的 影响 。 目 前 仅 发 现 Chang 等 (2016), Weidema 等 (2016) 以 及 Bidelman 和 
Walker(2017) 三 项 研究 , 但 结论 相反 。 前 两 者 发 现 , 声调 范畴 可 能 影响 音乐 音 高 变化 辨认 的 
敏感 性 , 支持 存在 迁移 ; 后 者 发 现 无 论 是 行为 层面 还 是 神经 层面 ,汉语 母语 者 对 语言 感知 的 
范畴 化 程度 都 高 于 音乐 , 说 明 范 畴 感知 模式 是 领域 特异 性 的 , 不 能 类 推 到 被 试 没有 经 验 的 领 
域 。 值 得 注意 的 是 , 在 实验 设计 上 , 三 项 研究 都 没 能 很 好 地 匹配 两 个 领域 的 材料 。Chang 等 
(2016) 使 用 的 三 音符 音乐 片段 区 分 任务 与 典型 的 范畴 感知 区 分 任务 差异 较 大 , 且 音 符 的 音 高 
间隔 小 ,汉语 组 区 分 成 绩 不 好 很 难说 是 范畴 感知 的 跨 领 域 抑制 作用 还 是 实验 任务 本 身 难 度 


coo} 


过 大 。Weidema 等 (2016) 对 普通 话 母 语 者 、 蓓 兰 语 母 语 非 音乐 家 和 和 蓓 兰 母 语音 乐 家 进行 的 调 
类 识别 实验 发 现 ， 普 通话 母语 者 和 荷兰 语 母语 的 音乐 家 对 上 升 、 下 降 范 畴 的 感知 都 好 于 荷兰 
语 母 语 非 音 乐 家 , 但 该 实验 只 有 识别 任务 没有 区 分 任务 , 且 其 中 的 “范畴 ? 指 领域 一 般 性 的 类 
别 ， 如 语言 ,音乐 中 都 存在 升 、 降 、 平 调 ， 无 法 确定 音乐 范畴 感知 是 否 源 于 语言 迁移 。 Bidelman 
和 Walker(2017) 使 用 的 语言 材料 和 音乐 材料 不 匹配 。 语 言 材料 是 从 /wu/ 到 /a/ 元 音 连续 统 ， 操纵 
的 变量 是 第 一 共振 峰 而 非 基 频 ; 音乐 材料 是 从 大 三 度 到 小 三 度 的 连续 统 , 操纵 的 变量 是 基 频 。 


是 
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13 母语 声调 复杂 度 差 异 对 跨 领域 音 高 感知 的 影响 


不 同 声调 语言 (方言 ) 的 声调 复杂 度 并 不 一 样 。 汉 语 普通 话 有 四 个 声调 ,一 些 语言 (方言 ) 


的 声调 系统 比 普通 话 更 为 复杂 : 泰语 有 五 个 声调 , 粤语 、 老 树 语 和 越南 语 都 有 六 个 声调 。 这 
2 些 语言 (方言 ) 中 存在 多 个 平 调 、 升 调 或 降 调 ， 只 是 音 高 不 同 。 一 些 研究 发 现 声调 系统 复杂 的 
语言 使 用 者 有 更 精细 的 音 高 感知 能 力 (Chen et al., 2012; Zheng et al., 2012; Zheng et al., 2014). 
= Zheng 等 2014) 通 过 ERP 研究 发 现 , 相 比 范畴 内 刺激 ,粤语 母语 者 对 非 语言 刺激 (合成 锯齿 波 ) 
CD 的 范畴 间 刺 激 产生 了 更 强 的 晚期 失 匹 配 成 分 ,而 汉语 普通 话 母 语 者 并 没有 观察 到 这 一 效应 ， 
A 这 暗示 粤语 母语 者 将 更 为 精细 化 的 音 高 感知 能 力 迁 移 到 了 非 语 言 感知 中 ,也 就 是 说 声调 系 
© 统 的 复杂 度 可 能 对 被 试 音 高 精细 感知 产生 跨 领 域 影响 。 然 而 ,我 们 还 未 见 到 相关 研究 , 能够 
> 证 实 母语 声调 复杂 度 对 音乐 音 高 感知 的 影响 。 


综 上 所 述 ， 目 前 对 声调 语言 母语 者 的 跨 领域 研究 虽然 揭示 了 母语 经 验 对 音乐 音 高 加 工 
的 促进 作用 , 但 多 关注 领域 一 般 性 的 音 高 迁移 ， 也 没有 考虑 到 声调 加 工 中 属于 语言 层面 的 影 
© HAR, 即 范畴 感知 模式 的 作用 以 及 不 同 声调 语言 系统 复杂 度 的 影响 。 本 研究 将 语音 范畴 感 

知 连续 统 应 用 于 音乐 音 高 感知 中 , 匹配 语音 刺激 与 音乐 刺激 的 音 高 特征 ， 并 以 声调 范畴 相对 
简单 的 汉语 母语 者 、 声 调 范畴 相对 复杂 的 越南 语 母语 者 为 研究 对 象 ， 同 时 选取 非 声调 的 俄语 
母语 者 作为 控制 组 ,讨论 以 下 问题 ; (0) 母 语 声调 范畴 感知 模式 能 否 迁 移 到 音乐 音 高 感知 中 ? 
(2) 母 语 声调 系统 的 复杂 度 差异 能 否 对 音乐 音 高 精细 感知 产生 跨 领域 影响 ? 

对 于 第 一 个 问题 ， 本 研究 预期 声调 语言 母语 者 感知 与 母语 音 高 匹配 的 音乐 音 高 时 ， 范畴 
感知 模式 可 以 被 激活 并 迁移 。 对 于 第 二 个 问题 , 我 们 选取 越南 语 作为 复杂 声调 语言 的 样本 。 
越南 语 标准 语 有 六 个 声调 调 类 , 如 表 1 所 示 ， 其 声学 特征 , 包括 曲折 程度 、 起 点 终点 音 高 、 
调 值 等 , 都 比 汉语 普通 话 更 为 丰富 。 本 研究 预期 声调 系统 的 复杂 度 差异 能 够 跨 领 域 对 音乐 音 
高 感知 产生 影响 ,越南 语 母 语 者 对 音乐 音 高 的 精细 感知 好 于 汉语 母语 者 .对 上 述 问 题 的 研究 , 
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“共享 论 ” 之 争 
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语言 音 高 感知 与 音乐 音 高 感知 的 关系 ， 从 声调 的 语言 特异 性 角度 认识 “模块 论 ” 与 


表 1 汉语 普通 话 和 越南 语 标准 语 声 调 的 调 类 和 调 值 


汉语 普通 话 调 类 调 值 越南 语调 类 调 值 

阴平 55 横 声 55 

阳平 35 aR 211 

上 声 214 问 声 213 

去 声 51 跌 声 21-4 
锐 声 35 
重 声 1 

TE: 越南 语 数据 源 自 咸 蔓 雪 (2016)。 


2 实验 方法 


2.1 被 试 


岁 


yo 


过 


90 人 参与 实验 , 其 中 汉语 母语 者 30 名 (以 下 简称 “汉语 组 ”), 14 男 16 女 , 平均 年 龄 21.9 


战 


， 越 南 语 母 语 者 30 名 (以 下 简称 “越南 语 组 ”), 13 男 17 女 , 平均 年 龄 22.1 岁 , 俄语 母语 者 
30 名 (以 下 简称 “俄语 组 ”), 15 男 15 女 , 平均 年 龄 21.2 岁 !。 越 南 语 组 和 俄语 组 都 未 接受 过 超 


1 个 月 的 汉语 训练 。 所 有 被 斌 都 未 接受 过 专业 书 
过 业余 训练 , BOS 3 年 。 被 试 的 童年 都 在 所 在 国度 过 ,无 居住 别 国 大 于 


几 构 的 声乐 或 器 乐 训 练 , 仅 有 个 别 被 试 接受 


TN 


年 的 经 历 。 体 检 


报告 表明 , 所 有 被 试 的 听力 正常 ,没有 言语 、 语 言 或 神经 疾病 。 根 据 爱 本 保利 手 量 表 (Oldfield， 


1971)， 被 试 篆 为 右 利 手 。 对 三 组 被 试 的 音乐 相关 能 力 进 


行 测量 : 采用 迷你 音乐 感知 技能 测试 


(Mini-PROMS, Zentner & Strauss, 2017) 评 估 音 乐 能 力 , 采用 蒙特 利 尔 失 歌 症 评估 量 表 


(MBEA, Peretz, Champod et al., 2003) 评 估 被 试 是 否 有 失 歌 症 ， 未 发 现 音乐 能 力 异常 者 及 失 歌 


0.540, BEFAR RRA 


Si 
IF 


到 一 定 的 报酬 。 


”为 避免 可 能 存在 的 方言 干扰 , 汉语 母语 者 选择 北方 方言 母语 者 或 南方 的 普通 话 母 语 者 ， 
等 及 以 上 。 北方 方言 母语 者 方言 声调 不 多 于 越南 标准 语 的 六 个 声调 。 越 南 语 母 语 者 来 自 河内 及 附近 地 区 , 日 常 使 用 语言 为 越南 标 


准 语 。 


症 者 , 对 三 组 被 试 的 评估 结果 分 别 进行 方差 分 析 , 迷你 音乐 感知 技能 测试 F(2,89) = 0.62, p = 


E 评 估量 表 F(2,89) = 1.51, p = 0.227， 差 异 均 不 显著 。 被 试 参加 实验 后 


常 使 用 语言 为 普通 话 , 水 平 为 二 级 
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2.2 实验 材料 


实验 采用 范畴 感知 范式 的 识别 任务 和 区 分 任务 。 实 验 材料 分 为 两 部 分 , 一 部 分 为 语音 刺 


激 , 一 部 分 为 音乐 刺激 。 


实验 刺激 材料 所 使 用 的 原始 语音 样本 为 音节 [ 税 , 无 上 下 文 语 境 ， 由 一 位 普通 话 二 级 甲 
等 的 男性 朗读 , 使 用 Audition 软件 录音 , 采样 率 为 44.1kHz。 使 用 Praat 软件 ,构造 一 个 由 [ 


(汉语 普通 话 阴平 /越南 语 横 


声 ) 到 [i (汉语 普通 话 阳平 /越南 语 锐 声 ) 的 连续 统 : 阴平 / 横 声 的 


起 点 和 终点 音 高 值 均 设 为 225Hz, 保持 终点 的 音 高 值 不 变 , 依次 降低 起 点 的 音 高 值 , 一 直到 


175Hz, 跨度 范 围 为 30Hz， 形成 一 个 包含 9 个 刺激 的 连续 统 。 在 合成 刺激 时 ， 将 刺激 起 点 音 


高 的 单位 由 琳 兹 (Hz) 转 换 为 等 
一 种 心理 声学 标准 ,能 真实 地 


SFE HE Hy iit by FE (equivalent rectangular bandwidth, ERB), + 


反映 实际 感知 到 的 频率 变化 情况 (Greenwood, 1961)。 单 个 刺 


激 的 持续 时 间 为 500 毫秒 , 接近 汉语 普通 话 和 越南 语 单 音节 的 时 长 ( 郭 锦 标 , 1993; 潘 武俊 英 ， 
2008)。 使 用 Praat 软件 中 高 分 辨 率 的 音 高 提取 算法 , 分 别提 取 9 个 语音 刺激 的 音 高 轮廓 , 合 
成 同 源 的 正弦 波 连续 音 以 模拟 音乐 刺激 ,保证 模拟 的 音乐 刺激 与 对 应 语音 刺激 的 音 高 轮廓 、 


振幅 和 持续 时 间 相同 。 语 音 刺 


225 1 


频率 (Hz) 


175 


K 2 给 出 两 类 刺激 起 始点 和 终点 的 音 高 参数 以 及 两 类 刺激 在 各 自 领域 内 的 实际 感知 结 


果 。 以 刺激 9 为 例 ， 该 刺激 起 


激 和 音乐 刺激 连续 统 的 音 高 模式 如 图 1 所 示 。 


| 500 
时 间 Cms) 


图 1 连续 统 音 高 模式 示意 图 


点 音 高 和 终点 音 高 分 别 为 175 Hz 和 225 Hz, 在 语言 中 被 感知 


为 普通 话 阳 平和 越南 语 锐 声 , 在 音乐 中 近似 于 一 个 从 大 字 组 F( 简 谱 标 记 为 4) 到 小 字 组 A( 简 


谱 标 记 为 7) 的 滑 音 ， 该 刺激 的 波形 图 和 频谱 图 如 图 2 所 示 。 


表 2 连续 统 各 刺激 的 起 始 音 高 参数 
6 
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刺激 BRAA Ehka (Hz) 步 幅 (ERB) 语音 刺激 音乐 刺激 


(Hz) (ERB) 感知 结果 感知 结果 

1 225 6.23 6.63 0.12 阴平 / 横 声 A 

2 218.37 6.10 6.52 0.12 A 

3 211.85 5.98 6.41 0.12 #G>A 
4 205.44 5.86 6.30 0.12 #G>A 
5 199.14 5.73 6.19 0.12 G>A 
6 192.95 5.61 6.09 0.12 G>A 
7 186.87 5.48 5.98 0.12 #F>A 
8 180.88 5.36 5.88 0.12 #F>A 
9 175 5.24 阳平 / 锐 声 F>A 


时 间 (s) 
(a) 语 音 刺激 (b) 音 乐 刺激 
图 2 语音 刺激 9 和 音乐 刺激 9 的 波形 图 (上 ) 和 频谱 图 (下 ) 


实验 采用 经 典范 畴 感知 研究 的 范式 ,包括 识别 任务 和 区 分 任务 两 部 分 , 在 计算 机 上 完成 ， 
材料 通过 E-prime3.0 软件 呈现 。 

识别 采用 ABX 任务 。 被 试 在 每 个 试 次 中 听 到 三 个 刺激 音 , 听 到 第 三 个 目标 刺激 音 后 ， 按 
键 判断 该 刺激 的 声调 与 第 一 个 刺激 音 ( 语 音 刺 激 1: 阴平 / 横 声 ; 音乐 刺激 1: A) 相 同 ( 按 “A” 键 ) 
还 是 与 第 二 个 刺激 音 (语音 刺激 9: 阳平 / 锐 声 ; 音乐 刺激 9: F 一 A) 相 同 ( 按 ' 民 ” 键 )。9 个 语音 刺 
激 每 个 出 现 10 次 , 9 个 音乐 刺激 每 个 也 出 现 10 次 , 两 类 刺激 共 180 个 试 次 。 实 验 开 始 时 , 在 
黑屏 上 显示 一 个 500 毫秒 的 视觉 提示 (白色 十 字 )， 然 后 依次 播放 刺激 1、 刺 激 9 与 目标 刺激 ， 
刺激 间距 为 500 毫秒 。 

区 分 采用 AX 任务 。 被 试 在 每 个 试 次 中 听 到 两 个 刺激 音 构成 的 一 个 刺激 对 ， 需 要 判断 两 
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个 刺激 是 否 相 同 , 相同 按 “A”* 键 , 不 同 按 “L” 键 。 刺 激 对 分 为 两 类 , 不 同 刺激 对 中 的 两 个 刺激 
相差 2 WY, 如 连续 统 中 的 第 一 个 和 第 三 个 刺激 构成 刺激 对 “1-3” 以 此 类 推 ,还 有 
“2-4”“3-5”4-6”“5-7”6-8”“7-9”， 每 个 刺激 对 重复 10 次 , 不 同 的 顺序 如 “1-3”“3-1” 备 5 次 ; 相 
同 刺激 对 中 的 两 个 刺激 完全 相同 ， 从 “1-1” 到 “7-7”。 刺 激 间 距 为 500 毫秒 ,每 个 刺激 对 重复 
10 次 。 语 音 刺激 和 音乐 刺激 各 设置 160 个 刺激 对 ,共计 320 个 试 次 。 实 验 开始 时 ,在 黑屏 上 
显示 一 个 500 训 秒 的 视觉 提示 (白色 十 字 )， 然 后 播放 刺激 对 。 

实验 试 次 呈 伪 随机 顺序 呈现 ， 以 确保 相同 试 次 不 连续 出 现 。 刺 激 播放 响 度 为 80 分 贝 。 
当 被 试 按键 判断 或 是 某 个 试 次 呈现 2500 毫秒 被 试 还 未 能 做 出 判断 ， 屏 幕 将 自动 出 现 500 Æ 
秒 的 间隔 然后 开始 下 一 试 次 。 随 机 抽取 一 半 被 试 先进 行 语言 任务 ,再 进行 音乐 任务 ; 另 一 半 
被 试 先进 行 音 乐 任务 , 再 进行 语言 任务 。 为 使 被 试 熟悉 实验 , 在 每 部 分 正式 实验 之 前 先 练习 ， 
练习 采用 的 刺激 与 正式 实验 不 同 。 被 试 可 以 一 直 进 行 练习 ， 直到 完全 掌握 实验 要 求 。 


yet 


S 2.4 数据 统计 


根据 Xu 等 (2006)、Peng 等 (2010)、Jiang 等 (2012) 的 方法 , 识别 任务 的 评价 标准 为 识别 
回归 曲线 的 斜率 和 范畴 边界 宽度 两 个 指标 ,， 区 分 任务 的 评价 标准 为 范畴 内 区 分 率 、 范畴 间 区 


分 率 和 峰 度 三 个 指标 。 


将 识别 任务 结果 进行 logistic 回归 分 析 , 得 到 回归 方程: In = bo + blx。 其 中 P 是 被 


试 将 实验 刺激 判定 为 阴平 / 横 声 /A 的 概率 , x 是 9 个 刺激 ,bo 是 回归 曲线 的 截 距 ,bi 是 回归 曲线 
的 斜率 。bi 绝对 值 越 大 ,范畴 化 程度 越 高 。 识 别 曲线 的 范畴 边界 宽度 为 P1= 0.25 和 了 li= 0.75 
之 间 的 线性 距离 ,范畴 边界 宽度 越 小 ,范畴 化 程度 越 高 。 

区 分 任务 中 , 将 所 有 刺激 对 分 为 7 个 刺激 对 组 ,每 个 刺激 对 组 包含 四 类 刺激 对 。 如 ， 刺 激 
对 组 “1-3?” 包 含 “1-3”“3-1”1-1”3-3” 四 类 刺激 对 。 数 据 以 刺激 对 组 为 单位 进行 统计 。 计 算 各 和 刺 


激 对 组 的 区 分 率 Pap。 计 算 公 式 为 : Pa) =P 二。P(S) +P. po. Hh, S 是 刺激 对 组 中 ,两 个 


刺激 相同 的 个 数 , D 是 两 个 刺激 不 同 的 个 数 , P(S) 是 相同 刺激 对 的 个 数 与 刺激 对 总 数 之 比 , PO) 


是 不 同 刺 激 对 的 个 数 与 刺激 对 总 数 之 比 ,P 二 是 被 试 做 出 “相同 "判断 的 刺激 对 与 所 有 相同 的 


刺激 对 数量 之 比 ,P 一 -是 被 试 做 出 “不 同 "判断 的 刺激 对 与 所 有 不 同 的 刺激 对 数量 之 比 。 按照 上 


述 方法 , 计算 每 个 刺激 对 组 的 正确 率 。 范畴 间 区 分 率 为 跨越 识别 曲线 范畴 边界 位 置 (识别 率 为 
0.5 时 ,对 应 的 识别 曲线 横 坐 标 值 ) 区 分 对 组 的 区 分 率 均 值 ， 如 被 试 识别 曲线 范畴 边界 为 5.1， 


8 


Xl 


那么 该 被 试 范畴 间 区 率 为 跨越 该 位 置 的 区 分 对 组 “4-6” 和 "5-7” 的 平均 区 分 正确 率 。 范 畴 内 区 分 
率 为 该 被 试 其 他 7 个 刺激 对 组 的 区 分 正确 率 均 值 。 峰 度 是 范畴 间 区 分 率 与 范畴 内 区 分 率 之 差 。 
范畴 化 程度 越 高 ， 范 畴 内 区 分 率 越 低 ， 而 范畴 间 区 分 率 和 峰 度 越 高 。 


3 实验 结果 


3.1 识别 任务 


三 组 被 试 语言 和 音乐 刺激 的 识别 率 图 像 如 图 3 所 示 , 汉语 组 和 越南 语 组 被 试 语音 刺激 和 
音乐 刺激 的 识别 率 较为 接近 , 在 连续 统 起 始 部 分 和 终点 部 分 的 几 个 刺激 分 别 接近 100% Fl 0, 
中 间 部 分 出 现 突变 ， 从 100% 又 降 至 接近 0, 基本 符合 范畴 感知 识别 任务 的 特征 ,而 俄语 组 无 
T 论 是 语音 刺激 还 是 音乐 刺激 ,都 与 两 个 声调 母语 组 差距 较 大 , 接近 于 连续 感知 。 


一 、 


语音 刺激 音乐 刺激 


100- a. os 一 全 一 越南 语 组 


wee 汉语 组 


80 
本 一 4 一 俄语 组 
$ 
= = 60 
or R 
R O 40 
20 
0 ie rpa 
. 和 
= 刺激 序号 刺激 序号 


加 


3 三 组 被 试 识别 任务 结果 示意 图 


三 组 被 试 识别 曲线 的 斜率 、 范 畴 边界 宽度 如 表 3 所 示 : 
表 3 三 组 被 试 识别 任务 相关 指标 ( = 90) 


Po 语音 刺激 音乐 刺激 
斜率 范畴 边界 宽度 斜率 范畴 边界 宽度 
越南 语 组 —1.83(0.45) 1.28(0.34) -2.20(0.58) 1.06(0.27) 
汉语 组 -2.39(0.70) 1.02(0.38) -2.43(0.54) 0.94(0.17) 
俄语 组 -0.79(0.79) 26.69(99.29) —0.83(0.84) 10.48(14.92) 
TE: 括号 内 是 标准 差 。 


以 组 别 (越南 语 、 汉 语 、 俄 语 ) 作 为 组 间 因 素 , 刺激 对 类 型 (语音 、 音 乐 ) 作 为 组 内 因素 , 对 
识别 曲线 斜率 、 范 畴 边界 宽度 分 别 进行 3x2 的 重复 测量 方差 分 析 。 结 果 显示 , 在 识别 曲线 的 


斜率 上 ,刺激 对 类 型 的 主 效应 显著 , FL, 87) = 6.19, p = 0.015, n = 0.07。 事 后 分 析 显 示 ,， 语音 


刺激 识别 曲线 的 斜率 显著 小 于 音乐 刺激 , p = 0.015, 95%CI = [-0.03, 0.27]。 组 别 主 效应 显著 ， 


F(2, 87) = 58.09, p < 0.001, nå = 0.57。 刺 激 对 类 型 和 组 别 的 交互 效应 显著 , F(2, 87)=3.29, p = 
0.042。 组 别 在 刺激 对 类 型 上 的 简单 效应 分 析 表 明 , 在 语音 刺激 上 , 汉语 组 显著 好 于 越南 语 组 ， 


p = 0.002, 95%CI = [0.22, 0.90]; 汉语 组 显著 好 于 俄语 组 , p < 0.001, 95%CI = [-1.39, -0.71]; 


越南 语 组 显著 好 于 俄语 组 , p < 0.001, 95%CI = [-1.94, -1.26]。 在 音乐 刺激 上 , 汉语 组 与 越南 


语 组 差异 不 显著 ,p = 0.186; 汉语 组 显著 好 于 俄语 组 ,p < 0.001, 95%CI = -1.72, -1.03]; 越南 


语 组 显著 好 于 俄语 组 , p < 0.001, 95%CI = [-1.95, -1.26]。 在 边界 宽度 上 ,刺激 对 类 型 的 主 效 


应 不 显著 , F(1, 87) = 0.87, p = 0.352。 组 别 主 效应 显著 , F(2, 87) = 3.40, p = 0.038, n} = 0.07. 


事后 分 析 显 示 , 汉语 组 与 越南 语 组 差异 不 显著 ,p = 0.980; 汉语 组 显著 高 于 俄语 组 ,P = 0.027, 


95%CI = [-33.01, -2.21]; 越南 语 组 显著 高 于 俄语 组 , p= 0.026, 95%CI = [-32.82, -2.01]。 刺 激 


对 类 型 和 组 别 的 交互 效应 不 显著 , F(2, 87) = 0.83, p = 0.352。 这 些 结 果 表 明 , 汉语 组 和 越南 语 


组 更 为 接近 ,他 们 与 俄语 组 差异 较 大 。 


3.2 区 分 任务 


三 组 被 试 语言 和 音乐 刺激 对 的 区 分 结果 如 图 4 所 示 , 区 分 任务 各 指标 如 表 4 所 示 : 


语音 刺激 音乐 刺激 
. 一 上 一 越南 语 组 
--s--- 汉 语 组 
70 frre 一 e。 俄语 组 


区 分 率 (%) 


130 24 3-5 46 5-7 68 79 1-3 24 35 46 5-7 68 7-9 
刺激 对 序列 刺激 对 序列 


P3 
AA 


4 三 组 被 试 区 分 任务 


cI 
DS 


吉 果 示意 


RA 三 组 被 试 区 分 任务 相关 指标 (n = 90) 


语音 刺激 音乐 刺激 
组 别 范畴 内 ie 范畴 内 il ie 
区 分 率 区 分 率 区 分 率 区 分 率 
越南 语 组 0.55(0.07) 0.60(0.09) 0.05(0.07) 0.56(0.05) 0.56(0.09) 0.07(0.09) 
汉语 组 0.55(0.12) 0.60(0.15) 0.03(0.17) 0.58(0.06) 0.66(0.11) 0.12(0.12) 
俄语 组 0.51(0.13) 0.49(0.24) -0.07(0.25) 0.48(0.21) 0.51(0.25) -0.04(0.23) 


注 : 括号 内 是 标准 差 。 


以 组 别 (越南 语 \ 俄语 、 汉语 ) 作 为 组 间 因 素 , 刺激 对 类 型 (语音 、 音 乐 ) 作 为 组 内 因素 ,对 


范畴 内 区 分 率 、 范 畴 间 区 分 率 、 峰 度 分 别 进 行 3x2 的 重复 测量 方差 分 析 。 结 果 显示 , 在 范畴 


内 区 分 率 上 , 刺激 对 类 型 的 主 效应 不 显著 , FL, 87) = 0.001, p= 0.972。 组 别 主 效应 显著 , F(2, 


87) = 4.95, p = 0.009, = 0.10。 刺 激 对 类 型 和 组 别 的 交互 效应 不 显著 , F(2, 87) = 0.92, p = 


0.404。 事 后 分 析 显 示 , 越南 语 组 显著 高 于 俄语 组 , p = 0.017, 95%CI = [0.01, 0.11]; 汉语 组 显 


= 著 高 于 俄语 组 , p = 0.004, 95%CI = [0.02, 0.12]; 汉语 组 与 越南 语 组 差异 不 显著 ,p= 0.615. Œ 


范畴 间 区 分 率 上 ,刺激 对 类 型 的 主 效应 不 显著 , FA, 87) = 0.36, p = 0.550。 组 别 主 效应 显著 ， 


F(2, 87) = 8.27, p = 0.001, nå = 0.16。 刺 激 对 类 型 和 组 别 的 交互 效应 不 显著 , F, 87) = 0.87, p = 


= 0.422。 事 后 分 析 显 示 , 越南 语 组 显著 高 于 俄语 组 , p = 0.009, 95%CI = [0.02, 0.15]; 汉语 组 显 


著 高 于 俄语 组 , p < 0.001, 95%CI = [0.07, 0.20]; 汉语 组 与 越南 语 组 差异 不 显著 ,p = 0.184. Fil 


激 对 类 型 和 组 别 的 交互 效应 不 显著 , F(2, 87) = 0.87, p = 0.422。 在 峰 度 上 ,刺激 对 类 型 的 主 效 


= 应 不 显著 , F(1, 87) = 3.52, p = 0.064。 组 别 主 效应 显著 , F(2, 87) = 8.80, p < 0.001, 人 = 0.17. ¥ 


后 分 析 显 示 ， 越 南 语 组 显著 高 于 俄语 组 , p = 0.002, 95%CI = [0.04, 0.17]; 汉语 组 显著 高 于 俄 


语 组 ,p < 0.001, 95%CI = [0.07, 0.20]; 汉语 组 与 越南 语 组 差异 不 显著 ,p = 0.487。 刺 激 对 类 型 


分 任 


Xl 


和 组 别 的 交互 效应 不 显著 , F(2, 87) = 0.87,p = 0.422。 以 上 结果 表明 ,两 个 声调 母语 组 


务 的 结果 基本 接近 , 与 俄语 组 差异 较 大 。 


本 研究 考察 了 声调 感知 中 的 语言 特异 性 因素 对 音乐 音 高 感知 的 跨 领 域 影响 , 选取 母语 


声调 类 型 相对 简单 、 声 调 类 型 相对 复杂 以 及 非 声调 语言 母语 者 作为 被 试 ,讨论 语言 加 工 层 画 
范畴 感知 模式 以 及 声调 系统 复杂 度 的 跨 领 域 迁 移 。 
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4.1 声调 范畴 感知 模式 的 跨 领 域 迁移 


第 一 个 问题 讨论 母语 声调 范畴 感知 模式 能 否 迁移 到 音乐 音 高 感知 中 。 实 验 结果 发 现 , 无 
论 在 语言 还 是 音乐 条 件 下 , 汉语、 越南 语 两 个 声调 母语 组 的 识别 曲线 都 出 现 了 突变 ， 区 分 曲 
线 都 出 现 了 区 分 峰 , 都 呈现 出 了 范畴 感知 模式 。 汉 语 组 和 越南 语 组 在 范畴 边界 宽度 、 范 畴 内 
区 分 率 、 范 畴 间 区 分 率 以 及 区 分 峰 度 等 指标 上 都 不 存在 语言 与 音乐 的 刺激 类 型 差异 ,说 明 母 
语 范畴 感知 模式 可 以 迁移 到 音乐 音 高 感知 中 , 这 一 结论 与 预期 一 致 。 而 俄语 组 识别 曲线 未 能 
出 现 明 显 突变 ,区 分 曲线 较为 平缓 并 出 现 多 个 区 分 峰 , 在 五 项 指标 上 与 两 个 声调 母语 组 差异 
显著 , 在 语言 音乐 两 类 刺激 上 不 存在 显著 差异 ,说 明 俄语 组 依靠 刺激 的 声学 属性 ， 对 语音 和 
音乐 刺激 做 出 了 较为 一 致 的 连续 感知 。 

以 往 从 语言 音 高 感知 到 音乐 音 高 感知 的 迁移 研究 ,实验 任务 多 为 两 个 音符 或 音乐 片段 
的 音 高 差异 区 分 (Pfordresher & Brown, 2009; Giuliano et al., 2011; Hutka et al., 2015)， 结 果 发 
现 声调 语言 母语 者 的 表现 好 于 非 声调 语言 母语 者 ， 这 是 由 于 声调 母语 音 高 曲 拱 的 加 工 经 验 
提高 了 对 音 高 感知 的 敏感 性 ,被 试 在 完成 实验 任务 时 只 需要 关注 音 高 的 物理 差异 这 一 因素 
(Giuliano et al., 2011)。 与 上 述 研究 不 同 ,本 研究 主要 考察 属于 音 位 层面 的 范畴 感知 模式 这 一 
声调 加 工 因素 的 迁移 ， 发 现在 音乐 音 高 的 识别 和 区 分 任务 中 , 两 个 声调 母语 组 都 呈现 出 了 与 
语音 刺激 类 似 的 模式 ,说 明 声 调 范畴 感知 模式 可 以 迁移 到 音乐 音 高 感知 中 。 本 研究 的 结果 支 
持 了 “共享 论 ”。 与 本 研究 结果 不 同 ,， 前 人 研究 中 ， 有 结果 表明 声调 语言 母语 者 在 音乐 音 高 感 
知 中 并 不 存在 优势 。 如 Pfordresher 和 Brown(2009) 的 研究 发 现 ， 虽 然 声调 语言 母语 者 总 体 上 
对 音乐 音 高 的 感知 好 于 非 声调 语言 母语 者 ,但 在 音 高 区 分 任务 中 的 表现 与 非 声调 语言 母语 
者 差异 不 显著 ,作者 因此 认为 音乐 和 语言 共享 资源 ,但 不 共享 表征 (Patel, 2008)。 本 研究 认为 ， 
得 出 此 结果 的 原因 可 能 就 在 于 上 述 研究 仅 关注 了 音 高 的 物理 差异 , 而 未 考虑 到 语言 层面 因 
素 的 影响 。 在 语言 层面 范畴 感知 模式 下 ,声调 语言 母语 者 虽 能 够 很 好 地 感知 范畴 间 刺 激 的 差 
异 ， 但 不 能 区 分 范畴 内 刺激 , 将 不 同 的 音乐 刺激 感知 为 相同 的 范畴 内 刺激 ,抑制 了 音 高 的 精 
细 感 知 。Pfordresher 等 人 的 研究 未 考虑 到 这 种 可 能 性 ， 故 得 出 与 本 研究 不 同 的 结论 。 尽 管 也 
学 者 提出 了 “母语 影响 “抑制 "(Bent et al., 2006; Tong et al., 2018) 等 概念 , 但 并 未 进行 详细 
讨论 。 具 体 来 说 , 这 种 “母语 影响 ”抑制 "可 能 源 于 母语 声调 范畴 的 跨 领 域 迁移 。 就 本 实验 而 
言 ， 如果 孤立 地 看 区 分 任务 中 两 个 声调 组 的 范畴 内 区 分 率 与 俄语 组 差异 并 不 显著 这 一 结果 ， 
极 有 可 能 忽略 范畴 感知 模式 的 跨 领域 抑制 作用 , 错误 地 认为 声调 语言 母语 者 的 音 高 加 工 优 
势 未 能 迁移 到 音乐 音 高 感知 中 , 得 出 支持 “模块 论 ” 的 结论 。 总 之 , 进行 声调 母语 者 的 音乐 音 
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高 感知 结果 解释 时 ,应 充分 考虑 到 范畴 感知 因素 的 作用 。 

本 研究 的 结果 与 Chang 等 (2016) Weidema 等 (2016) 基 本 一 致 而 与 Bidelman 和 
Walker(2017) 不 同 。 这 可 能 是 由 于 Bidelman 等 人 的 研究 并 未 做 到 语音 刺激 与 音乐 刺激 的 匹配 。 
一 般 情况 下 , 语言 中 的 声调 与 音乐 中 的 音符 分 属 不 同 的 表征 , 声调 以 范畴 化 的 方式 表征 ,而 
音乐 音 级 以 离散 的 方式 表征 (Bradley, 2013), 音乐 家 不 能 将 音程 知识 直接 迁移 到 声调 感知 中 ， 
调 语言 母语 者 也 不 能 将 范畴 感知 模式 直接 迁移 到 音乐 旋律 感知 中 。 只 有 一 个 领域 获得 的 特 
定 音 高 范畴 经 验 与 男 一 个 领域 需要 加 工 的 音 高 信息 相 匹 配 , 这 种 促进 效应 才 可 能 发 生 


<< 


Es 
Pe 


(Asaridou & McQueen, 2013). Bidelman 和 Walker(2017) 使 用 的 语言 材料 是 元 音 连 续 统 ， 音 乐 
材料 是 从 大 三 度 到 小 三 度 的 连续 统 ， 二 者 并 不 同 质 ， 音 高 信息 也 不 能 匹配 ,被 试 在 完成 音乐 


音 高 区 分 任务 时 不 能 激活 语音 的 范畴 感知 模式 。 


4.2 母语 声调 系统 的 复杂 度 差 异 对 音乐 音 高 感知 的 影响 


本 研究 的 第 二 个 问题 是 母语 声调 系统 的 复杂 度 差异 能 否 影 响 音乐 音 高 精细 度 感知 。 对 音 
高 感知 精细 度 问 题 的 考察 一 般 采 用 音 高 区 分 任务 (Pfordresher & Brown, 2009; Giuliano et al., 
2011; Hutka et al., 2015)。 本 实验 中 的 区 分 任务 测量 被 试 对 不 同音 高 的 语音 /乐音 的 区 分 程度 ， 
可 以 反应 被 试 对 音 高 精细 度 差 异 的 感知 。 但 研究 结果 发 现 ,越南 语 组 与 汉语 组 无 论 是 范畴 内 
还 是 范畴 间 区 分 率 , 在 语言 和 音乐 音 高 条 件 下 差异 都 不 显著 , 表明 母语 的 复杂 声调 系统 并 不 
能 促进 跨 领域 的 音乐 音 高 精细 感知 。 实 验 结果 未 能 支持 预期 。 

导致 这 一 结果 的 原因 可 能 有 二 。 第 一 ， 从 语言 角度 看 ， 本 研究 的 语言 材料 是 汉语 普通 话 
阴平 -阳平 /越南 语 横 声 - 锐 声 连续 统 ， 越 南 语 组 被 试 在 感知 时 激活 的 越南 语 声调 表征 与 汉语 
组 被 试 激活 的 普通 话 声调 表征 基本 一 致 ， 因此 两 组 被 试 范畴 间 区 分 率 不 存在 显著 差异 。 较 之 
汉语 普通 话 ， 越南 语 声调 的 复杂 性 体现 在 玄 声 、 跌 声 等 调 类 上 ,本 研究 的 实验 材料 并 不 包含 
这 些 声调 ,故而 未 能 检验 出 越南 语 被 试 复杂 声调 系统 带 来 的 更 为 精细 的 声调 加 工 能 力 。Peng 
等 2010) 和 Zheng 等 (2012) 对 比 了 普通 话 和 声调 系统 更 为 复杂 的 粤语 , 也 得 出 了 类 似 结 论 。 
他 们 的 行为 研究 发 现 ,感知 汉语 普通 话音 高 时 ， 粤 语 母 语 者 与 普通 话 母语 者 在 声学 层面 未 见 
差异 。 但 是 , Zheng 等 (2012) 的 ERP 实验 发 现 , 在 语言 内 部 ,粤语 母语 者 的 精细 音 高 感知 优势 
可 以 向 汉语 普通 话 声调 感知 迁移 ， 这 种 影响 仅 发 生 在 大 脑 皮质 层面 而 不 能 体现 在 行为 层面 。 
未 来 可 开展 神经 电 生 理 研究 ,进一步 探究 母语 声调 复杂 度 差异 对 音乐 音 高 感知 的 跨 领域 影 
响 问题 。 第 二 ， 从 音乐 角度 看 ， 本 研究 结果 发 现 ， 两 组 声调 语言 母语 者 音乐 刺激 的 范畴 间 


Dx 
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分 率 都 显赫 高 于 俄语 母语 者 ,这 表明 声调 语言 经 验 对 于 跨 领 域 的 音乐 音 高 区 分 有 显著 的 增 


益 作用 ,从 语言 到 音乐 这 一 方向 支持 了 “共享 论 ” 以 及 Besson 等 (2011) 的 训练 迁移 效应 说 。 但 


根据 OPERA 假说 (Patel, 2012), 音乐 经 验 比 语言 经 验 更 能 够 促进 精细 的 音 高 感知 ， 因 为 音乐 
感知 需要 不 断 调节 和 监控 音调 ,对 编码 精度 的 要 求 更 高 。 以 往 实证 研究 也 发 现 类 似 的 结论 ， 
在 辨别 一 些 以 声学 信息 为 基础 的 非 母 语 声调 上 , 声调 语言 母语 者 不 如 音乐 家 (Cooper & 

Wang, 2012; Chang et al., 2016)。 因 此 ,尽管 越南 语 的 声调 系统 较 汉 语 普通 话 更 为 复杂 , 但 与 
音乐 旋律 相 比 , 越南 语调 类 数量 和 音 高 精细 程度 仍 显 简 单 ， 因 此 越南 语 母 语 者 感知 音乐 音 高 
时 ,在 行为 层面 没 能 产生 跨 领域 的 促进 作用 。 


T 


本 研究 考察 了 影响 声调 加 工 的 语言 学 因素 对 音乐 音 高 感知 的 跨 领域 迁移 。 研究 发 现 ， 声 
调 的 范畴 感知 模式 可 以 迁移 到 音乐 音 高 感知 中 ; 复杂 的 母语 声调 并 不 能 促进 跨 领域 音乐 音 
高 精细 感知 。 研 究 结 果 从 语言 对 音乐 加 工 影响 的 角度 支持 了 “共享 论 ”。 
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Abstract 
Pitch is a fundamental acoustic property shared by both language and music. However, there 
are different views on the processing of tonal pitch and musical pitch. Some studies support the 


“modularity view”, suggesting that tonal pitch and musical pitch are represented separately. In 
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contrast, more studies support the “shared domain-general view”, implying that there are 
commonalities in the processing of tonal pitch and musical pitch based on their physical 
similarities. The existing studies have mostly focused on domain-general pitch transfer; 
nonetheless, they have not considered domain specificity of the tonal pitch as a linguistic element. 
Hence, it remains unclear whether domain specificity factors, such as categorical perception and 
complexity of different tonal language experiences on speakers’ pitch processing, play a role in 
musical pitch perception. 

To address the above issues, ninety participants were involved in the experiment, including 
native speakers of Mandarin Chinese (with a relatively simple pitch category), native speakers of 
Vietnamese (with a relatively complex pitch category), and native speakers of Russian 
(nonpitched control group). A 3 (group: Vietnamese vs. Chinese vs. Russian) x 2 (stimulus type: 
speech vs. music) between-and-within-subjects design was used. A continuum from [i'] (closed for 
Yinping in Chinese and Transverse in Vietnamese) to [i"] (closed for Yangping in Chinese and 
Acute in Vietnamese) and its musical counterpart was constructed. Participants were first tested in 
an ABX identification task to determine whether the stimulus X was similar to A or B and then an 
AX discrimination task to decide whether the two stimuli in the pair were identical. The 
experiment was performed in E-prime 3.0. 

The results showed that (1) both the Chinese and Vietnamese groups showed categorical 
perception for language and music pitches. There were no differences between language and 
music stimuli in category boundary width, within-category discrimination rate, between-category 
discrimination rate, or discrimination peak for either group. The Russian group’s identification 
curve did not show abrupt shifts, and their discrimination curve was relatively flat with multiple 
peaks, which indicates a continuous pattern significantly different from the two tonal language 
groups. (2) There were no significant differences between the Vietnamese group and the Chinese 
group in either the within-category discrimination rate or the between-category discrimination 
rate. 

The experimental results suggest that at the behavioral level, the pattern of native tonal 
categorical perception can transfer to musical pitch perception, but tonal complexity does not 


facilitate cross-domain musical pitch perception. The findings of this study support the “shared 
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domain-general view” in terms of the influence of language on musical pitch processing. 


Key words categorical perception, pitch, tone, music 
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